基于系统生物学的前列腺癌生物靶点的整合分析

基于系统生物学的前列腺癌生物靶点的整合分析

作者:师大云端图书馆 时间:2015-06-15 分类:论文格式 喜欢:2058
师大云端图书馆

【摘要】目的前列腺癌是欧美等发达国家和地区最常见的男性恶性肿瘤之一,其死亡率已居各种癌症的第二位。前列腺癌的发生是多种调控因子共同作用的结果,然而前列腺癌的发生机制至今尚未明确。那么如何寻找治疗前列腺癌的有效靶点成为了亟待解决的问题。随着生物大规模分型技术的发展使全基因组范围寻找前列腺癌风险靶点成为可能,如单核苷酸多态性(SingleNucleotidePolymorphism,SNP)位点分型。在这项研究中,全基因组关联研究(Genome-WideAssociationStudies,GWAS)通过大量比较疾病患者(病例,case)和相同条件下的无该疾病的人(对照,control)的SNP-表型关联来寻找疾病的潜在风险靶点。另外一种方法是通过基因芯片技术大规模筛选前列腺癌的差异表达基因,然后通过基因本体、通路富集分析或基因网络分析对这些差异表达基因进一步筛选以获得潜在的基因治疗靶点。但以上两种研究方法都具有一定的局限性。虽然全基因组关联研究发现了大量的疾病风险SNPs,但相对全基因组SNPs来说仍然只是极小的一部分。而且研究发现绝大部分报导的SNPs都不处于基因编码区,这就意味着如何来解释这些SNPs的功能是整个研究最大的难题。另外,基因差异表达筛选旨在寻找单个或多个最具可能的致病基因,然而这些基因的致病机制却没有得到有效的阐明,如在整个疾病的生物学过程中这些基因之间或与其他基因是否有相互作用,是如何相互作用的?方法一、前列腺癌风险位点的后GWAS功能分析1.提取GWASCatalog数据库报导的前列腺癌的风险SNPs,通过连锁不平衡(linkagedisequilibrium,LD)获得所有可能的风险SNPs;从文献及公共数据库搜集淋巴细胞系(lymphoblastoidcelllines,LCLs)相关的表达数量性状座(expressionQuantitativeTraitLoci,eQTL)数据;2.使用ANNOVAR软件对所有SNPs进行注释分析;使用UCSC数据库现有的已知调控数据对所有SNPs进行注释分析;使用eQTL对非编码区的SNPs进行注释分析;获得前列腺癌关联基因;3.对前列腺癌关联基因进行基因本体(GeneOntology,GO)、通路富集分析;建立并分析前列腺癌特有的转录调控网络。二、前列腺癌关联SNPs显著富集在cis-eQTL和转录因子结合位点(transcriptionfactorbindingsites,TFBS)1.定义前列腺癌GWAS中p<10-3的SNPs为高关联SNPs;从美国国家生物技术信息中心(NationalCenterforBiotechnologyInformation,NCBI)dbGaP数据库下载GWAS数据:TheCancerGeneticMarkersofSusceptibility(CGEMS)和TheMultiethnicCohort(MEC);从公共数据库seeQTL和RegulomeDB中分别提取eQTL和TFBS数据;2.分别使用randomization和permutation方法检验高关联SNPs是否显著富集于eQTL和/或TFBS;3.从GWASCatalog数据库提取报导的癌症关联SNPs,使用randomization检验这些SNPs的eQTL和TFBS富集情况;4.对eQTL和TFBS的富集结果进行整合分析,获得潜在功能SNPs靶点。三、基于GO的前列腺癌基因共表达模块1.从前列腺癌基因表达芯片数据和GO中生物过程(biologicalprocess,GO_BP)基因集(term)出发,构建每个term的基因表达矩阵;2.利用WGCNA计算每个GO_BPterm在两个独立前列腺癌基因表达矩阵间的保守程度;3.利用WGCNA对每个保守的BP_term建立共表达scale-free网络并进行聚类分析,获得共表达模块;4.计算共表达模块的显著性:1)计算每个共表达模块的eigengene表达,并判断模块是否在疾病-对照(case-control)组间存在差异表达,2)如果模块存在差异表达,则进一步计算模块的保守程度;5.对4中得到的重要模块进行基因富集分析,如eQTL、拷贝数变异(CopyNumberVariation,CNV)和突变(Mutation)基因集;6.如果模块在显著富集eQTL基因的前提下,也能在CNV和/或Mutation基因集中显著富集,这个模块将被定义为前列腺癌风险性模块。我们进一步对这些风险性模块进行转录因子(transcriptionfactor,TF)和小RNA(microRNA,miRNA)富集,获得能调控这些模块的TF和miRNA。同时我们也检验了这些富集的TF基因的差异表达情况。结果一、前列腺癌风险位点的后GWAS功能分析从GWASCatalog中我们一共提取了49个SNPs,经过LD计算一共获得1828个前列腺癌潜在风险SNPs。ANNOVAR注释表明有8,599,377,4,12,6和10个SNPs分别位于外显子,内含子,剪切位点,非编码RNA,3’UTR,5’UTR,基因上游,基因下游区域,而其余的852个SNPs则位于非基因区。UCSC注释结果表明1828个SNPs中,有284个SNPs位于UCSC定义的调控区域内,而这284个SNPs仅包含了86个非基因区的SNPs。对所有非基因区SNPs而言,eQTL比对解释了其中138个SNPs。综合ANNOVAR注释,eQTL比对结果及GWASCatalog本身报导的基因,我们共得到了205个前列腺癌风险基因,其中41个来自ANNOVAR注释,151个来自于eQTL比对,33个来自GWAS文献报导。通过GO及通路富集,我们发现这些基因能有效的富集在癌症相关的通路上,如细胞死亡调控,细胞凋亡,细胞增殖等。通过分析前列腺癌调控网络,我们发现了一些重要的癌症调控因子,如IGF-1/IGF-2受体,SP1,CREB1,AR等转录因子。二、前列腺癌关联SNPs显著富集在cis-eQTL和转录因子结合位点(transcriptionfactorbindingsites,TFBS)通过randomization和permutation计算结果对比,我们发现在前列腺癌GWASSNPs含有相对较少eQTLSNPs(eSNPs)情况下,randomization会导致假阴性,permutation则更为准确。富集分析发现白种人群的GWASSNPs显著地富集在cis-eQTL和TFBS,但在美国黑人和日本人群中,我们却并没有发现这种显著的富集模式。同时我们对GWASCatalog的SNPs进行分析,也发现了这一种群差异性的富集模式。另外对CGEMS数据的整合分析我们发现了2个并没有在GWAS平台中出现的功能SNPs,rs2861405和rs4766642,可以通过eQTL和TFBS行驶调控功能。三、基于GO的前列腺癌基因共表达模块首先我们发现了118个GO_BPterms在两个数据集间(GSE17951,GSE6956)具有较高的保守性(Zsummary>5)。利用这118个term的基因表达矩阵,我们共建立了548个共表达模块,其中有294个模块和前列腺癌有显著关联(p<0.05)。对这294个模块进一步分析,我们发现有55个模块在GSE17951和GSE6956间具有很好的保守性(Zsummary>5)。然后我们使用eQTL、CNV和Mutation基因集对这55个模块进行富集分析,并发现了5个前列腺癌风险模块M1~M5。TF富集分析结果表明M1和M5模块主要被NFAT调控,M2,M3和M4模块主要被SP1调控;miRNA富集分析表明M1和M3被has-miR-19a调控,M4和M5被has-miR-15a调控,M2被has-miR-200b调控。结论一、我们建立了系统生物学水平上前列腺癌GWASSNPs的整合分析。通过注释、GO/通路富集和调控网络构建能有效阐明SNPs的作用机制,特别是那些位于非基因区的SNPs的调控功能。二、前列腺癌关联SNPs的调控机制具有种群差异性,即白种人群的关联SNPs主要通过eQTL和TFBS这两种方法来调控基因的表达,而美国黑人或日本人群的关联SNPs可能通过其他方法来进行调控。三、通过建立及分析基于GO的前列腺癌共表达模块,我们回答了(1)哪些GO项与前列腺癌潜在相关,(2)GO项的哪些基因的可以形成共表达模块,(3)哪些共表达模块与前列腺癌相关,(4)哪些共表达模块能显著富集癌基因的信号以及最终发现的共表达模块又是由什么遗传因子调控的。
【作者】蒋峻峰;
【导师】沈百荣;
【作者基本信息】苏州大学,系统生物学,2013,博士
【关键词】前列腺癌;全基因组关联研究;单核苷酸多态性;表达数量性状座;转录因子结合位点;基因本体;通路;网络;共表达;

【参考文献】
[1]乌日娜.珠宝首饰设计师的商业价值实现研究[D].中国地质大学(北京),设计艺术学,2013,硕士.
[2]乔俊飞,柴天佑.板形控制技术现状及未来发展[J].冶金自动化,1997,01:11-14+41.
[3]张鹏.基于ARM的船闸嵌入式数据采集及发布终端系统的设计与实现[D].江苏科技大学,机械工程,2014,硕士.
[4]本刊编辑部.石墨烯功能纳米材料及其在食品安全传感器中的应用研究[J].信阳师范学院学报(自然科学版),2013,02:313.
[5]赵启蒙.用于植物生长补光的LED照明系统研究[D].复旦大学,物理电子学,2012,硕士.
[6]易庆.湖南省中小学民族乐团的发展探究[D].湖南师范大学,学科教育(专业学位),2014,硕士.
[7]任磊.棉花图像分割算法研究[D].新疆大学,通信与信息系统,2013,硕士.
[8]钱堃,毛保华.城市轨道交通客流强度及其基本特征分析[J].综合运输,2014,01:66-69.
[9]武伟国.丙烯酸系及酚醛系树脂的环氧基改性[D].西北师范大学,生物化学与分子生物学,2013,硕士.
[10]刘宇欣.挤压—复合酶法制备多孔淀粉研究[D].东北农业大学,粮食、油脂及植物蛋白工程,2013,硕士.
[11]朱寒亮.PARP-1在前列腺癌中表达的意义及其在前列腺癌PC3细胞株增殖中的作用研究[D].广州医科大学,外科学,2014,硕士.
[12]桂花.锡勒图库伦寺庙传说研究[D].内蒙古大学,中国少数民族语言文学,2013,硕士.
[13]谭雨萌.宫泽贤治童话中动物的象征性[D].华中师范大学,日语语言文学,2013,硕士.
[14]明亮.基于DMS的DWDM高速多通道QPSK系统的传输控制[D].南京邮电大学,光学工程,2013,硕士.
[15]邓婕.城市商圈用地结构演变及用地效益研究[D].重庆大学,管理科学与工程,2014,硕士.
[16]叶琳昌,曲慧.住宅建筑屋面的优化构造组合[J].住宅产业.2004(09)
[17]张雪亮,刘明光,钟鈜州.p-q谐波检测的改进算法与仿真分析[J].电测与仪表,2014,17:24-28.
[18]桑松.船型方案论证与智能决策方法研究[D].大连理工大学,2002.
[19]刘魁伟.第30届奥运会中国女排二传分配球效果分析[D].鲁东大学,运动训练(专业学位),2013,硕士.
[20]傅士光.基于主题的搜索引擎的研究与实现[D].北京交通大学,2007.
[21]叶丽霞.中职学校双师型教师的培养[D].华中师范大学,教育管理,2013,硕士.
[22]夏慕.亲子依恋对于大学生社交焦虑的影响[D].内蒙古师范大学,心理健康教育(专业学位),2013,硕士.
[23]何孟颉.家兔MITF基因同源性、多态性分析及不同时期表达水平研究[D].扬州大学,动物遗传育种与繁殖,2012,硕士.
[24]张静.基于JPEG的图像编辑与增强方法的研究与设计[D].北方工业大学,计算机技术,2014,硕士.
[25]戚伟军.江门市社会保险数据与应用大集中系统建设[D].重庆大学,2005.
[26]李妍.中学生道德同一性与亲社会行为的关系研究[D].河北师范大学,发展与教育心理学,2012,硕士.
[27]刘欣.生物产业高级复合型管理人才培育研究[D].湖北工业大学,企业管理,2014,硕士.
[28]沈睿.多智能代理技术在分销管理信息系统中的应用研究[D].浙江大学,2005.
[29]李爱群.马钢511~#变电所综合自动化改造[J].冶金自动化,2001,04:54-57.
[30]周天旭.楼梯对钢筋混凝土建筑抗震性能的影响[D].西南交通大学,结构工程,2014,硕士.
[31]惠利.工业化过程中城市化、经济增长对城乡收入差距的影响[D].河南财经政法大学,西方经济学,2013,硕士.
[32]王黎明.基于知识库的飞机驾驶舱布局设计方法研究[D].西北工业大学,飞行器设计,2004,硕士.
[33]吴引弟.计算机软件的知识产权保护研究[D].中国政法大学,法律,2004,硕士.
[34]王璐.智慧城市建设成熟度评价研究[D].哈尔滨工业大学,管理科学与工程,2013,硕士.
[35]张梦君.小型高Q值介质填充谐振腔微扰法测量微波复介电常数研究[D].南京邮电大学,电磁场与微波技术,2013,硕士.
[36]李祖胤.粉末态大豆分离蛋白贮藏过程中的氧化及其对溶解度的影响[D].江南大学,食品科学,2012,硕士.
[37]王振华.浅析纳米材料新进展[J].生物技术世界,2013,03:150.
[38]田耘.沈阳市贫困脑瘫儿童抢救性康复项目满意度调查及影响因素分析[D].吉林大学,公共卫生,2012,硕士.
[39]张珂.巩义广播电视大学发展研究[D].郑州大学,公共管理(专业学位),2013,硕士.
[40]李星亮.钨/钼膜的固体润滑表面处理及其摩擦化学机理研究[D].中国地质大学(北京),机械工程,2013,硕士.
[41]汤丽.飞行数据管理记录系统关键技术研究[D].西北工业大学,2004.
[42]黄建坤.周期性排桩和波屏障在土木工程减振中的应用研究[D].北京交通大学,2014.
[43]崔展.Vaspin与冠心病的相关性研究[D].苏州大学,内科学,2013,硕士.
[44]李佳阳.空间模数方法在城市设计中的运用初探[D].西安建筑科技大学,建筑学,2013,硕士.
[45]许树龙.浅谈当前中国社会状况对住宅厨房的影响[J].中国住宅设施.2002(01)
[46]陈海英.相对独立区与主体城区联系型交通问题研究[D].大连理工大学,城市规划与设计,2013,硕士.
[47]王晓伟.餐厨垃圾饲料化工艺恶臭污染物排放特性研究[D].沈阳航空航天大学,安全技术及工程,2013,硕士.
[48]王莉晓.我国城乡污染转移的法律规制研究[D].南京农业大学,经济法学,2011,硕士.
[49]黄媛.图案数字化交互应用研究[D].湖北工业大学,设计艺术学(专业学位),2014,硕士.
[50]卢璐.离子液体和纳米材料提高电化学传感器性能之新策略[D].山东大学,分析化学,2014,博士.

相关推荐
更多